Stata:线性趋势检验-lintrend
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会寒假班
作者:闫天琳 (中山大学)
邮箱:yantlin@mail2.sysu.edu.cn
编者按:本文部分摘译自下文,特此致谢!
Source:Garrett, J. M. 1996. sg50: Graphical assessment of linear trend. Stata Technical Bulletin 30: 9–15. In Stata Technical Bulletin Reprints, vol. 5, 152–160. College Station, TX: Stata Press. -PDF-
目录
1. 简介
2. 命令介绍
3. Stata 实操
3.1 探究与高血压有关的因素
3.2 探究与背痛康复有关的特征
4. 参考文献
5. 相关推文
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
1. 简介
在经济学研究中,我们经常要研究变量之间的相关关系。其中,线性相关是非常基础且重要的一种相关关系。通过线性回归,我们可以进行因果分析和数据预测。当然上述研究的前提是,变量之间需要满足线性关系,这就需要进行线性趋势的检验。
本篇推文介绍 Stata 中用于线性趋势检验的命令 lintrend
。该命令通过报告不同组别中 (根据自变量分组,例如五等分) 因变量的取值 (若为连续变量,则为组内均值;若为二元变量,则为比例和对数几率) 和绘制相关图形,来检验变量间是否满足线性关系。
2. 命令介绍
*命令安装
ssc install lintrend, replace
*命令语法
lintrend yvar xvar [if exp] [in range], [groups(#) round(#) int] [graph noline graph_options]
其中,
yvar
: 因变量。如果是二元变量,则按分组变量计算其比例和对数几率,否则按分组变量计算其均值;xvar
: 自变量 (分组变量)。
option
如下:
group(#)
:将自变量xvar
等分成若干组,并用组内均值代表组值;round(#)
:将自变量xvar
四舍五入到#
倍数,以此作为组别划分依据;integer
:若自变量xvar
是整数,则直接根据具体数值分组。graph
:绘制图形。yvar
为连续变量,则绘制其均值,yvar
为二元变量,则绘制其对数几率 (Log odds of Y for binary yvar);noline
:不绘制回归线。
3. Stata 实操
3.1 探究与高血压有关的因素
在本例中,我们使用来自对 1784 个 24-51 岁成年人的高血压调查数据集 (hyperten)。其中,sbpavg 为平均收缩压,age 为年龄,ses 为社会经济地位,hbp 为是否高血压。首先,我们使用 groups(#)
分组来检验高血压与年龄的关系。
. lxhuse hyperten.dta, clear
. describe
Contains data from hyperten.dta
Observations: 1,784
Variables: 4 6 Feb 1996 16:49
----------------------------------------------------------------
Variable Storage Display Value
name type format label Variable label
----------------------------------------------------------------
sbpavg float %9.0g Average Systolic Blood Pressure
age byte %8.0g Current Age
ses byte %8.0g seslbl Socioeconomic Status
hbp byte %8.0g yesno High Blood Pressure
----------------------------------------------------------------
将样本分成 10 个大小相等的组,并计算每个年龄组中高血压 (1=高血压,0=正常) 的比例和对数几率。
. lintrend hbp age, groups(10) graph
The proportion and ln(odds) of hbp by categories of age
(Note: 10 age categories of equal sample size;
Uses mean age value for each category)
+------------------------------------------------+
| age min max d total hbp ln_odds |
|------------------------------------------------|
| 26.0 24 27 24 246 0.10 -2.22 |
| 28.5 28 29 27 165 0.16 -1.63 |
| 30.6 30 31 26 169 0.15 -1.70 |
| 32.4 32 33 34 179 0.19 -1.45 |
| 34.5 34 35 43 151 0.28 -0.92 |
| 36.5 36 37 44 163 0.27 -0.99 |
| 39.0 38 40 70 220 0.32 -0.76 |
| 41.9 41 43 66 152 0.43 -0.26 |
| 45.5 44 47 86 200 0.43 -0.28 |
| 49.0 48 51 65 137 0.47 -0.10 |
+------------------------------------------------+
可以看出,年龄和高血压之间存在正线性关系。然后,我们使用 round(#)
分组来检验高血压与年龄的关系,即将年龄四舍五入到 #
的倍数。
. lintrend hbp age, round(5) graph
The proportion and ln(odds) of hbp by categories of age
(Note: age in categories rounded to nearest 5)
+------------------------------------------------+
| age min max d total hbp ln_odds |
|------------------------------------------------|
| 25 24 27 24 246 0.10 -2.22 |
| 30 28 32 72 436 0.17 -1.62 |
| 35 33 37 102 391 0.26 -1.04 |
| 40 38 42 117 323 0.36 -0.57 |
| 45 43 47 105 249 0.42 -0.32 |
| 50 48 51 65 137 0.47 -0.10 |
+------------------------------------------------+
接着,使用 integer
分组来检验高血压与社会地位之间的关系。社会经济地位 ses 是一个序数变量,ses=1 表示低社会经济地位,ses=2 表示中等社会经济地位,ses=3 表示高社会经济地位。
. lintrend hbp ses, integer graph
The proportion and ln(odds) of hbp by categories of ses
(Note: ses in categories using original values)
+-----------------------------------------+
| ses d total hbp ln_odds |
|-----------------------------------------|
| 1:Low 215 670 0.32 -0.75 |
| 2:Middle 138 537 0.26 -1.06 |
| 3:High 117 512 0.23 -1.22 |
+-----------------------------------------+
可以看出的是,高血压随着社会经济地位的上升而减少,两者有较强的负线性相关性。
最后,使用 groups(#)
分组来检验平均收缩压与年龄的关系。前面的例子检验的是二元变量 (是否高血压),lintrend
会计算对数几率。在本例中,我们将使用连续变量平均收缩压 sbpavg 来代表高血压,lintrend
则会计算平均值。
. lintrend sbpavg age, groups(10) graph
The mean of sbpavg by categories of age
(Note: 10 age categories of equal sample size;
Uses mean age value for each category)
+-----------------------------------+
| age min max total sbpavg |
|-----------------------------------|
| 26.0 24 27 246 120.83 |
| 28.5 28 29 165 119.79 |
| 30.6 30 31 169 120.27 |
| 32.4 32 33 178 122.99 |
| 34.5 34 35 151 124.16 |
| 36.5 36 37 163 125.56 |
| 39.0 38 40 219 124.53 |
| 41.9 41 43 152 129.62 |
| 45.5 44 47 200 131.05 |
| 49.0 48 51 137 132.59 |
+-----------------------------------+
3.2 探究与背痛康复有关的特征
本例数据来自于对 1552 个背痛患者进行了 6 个月的随访,以确定与康复相关的特征的调查数据。其中,better 为八周后的恢复概率 (1=全部恢复,0=没有恢复),score 为残疾状况。
. lxhuse backpain.dta, clear
. describe
Contains data from backpain.dta
Observations: 1,552 Recovery from back pain
Variables: 4 9 Feb 1996 16:32
----------------------------------------------------------------------
Variable Storage Display Value
name type format label Variable label
----------------------------------------------------------------------
better byte %8.0g yesno Better at 8 Weeks
score byte %8.0g Disability Score
score_2 int %9.0g Disability Score Squared
score_3 int %9.0g Disability Score Cubed
----------------------------------------------------------------------
. lintrend better score, groups(12) graph
The proportion and ln(odds) of better by categories of score
(Note: 12 score categories of equal sample size;
Uses mean score value for each category)
+----------------------------------------------------+
| score min max d total better ln_odds |
|----------------------------------------------------|
| 0.4 0 1 151 170 0.89 2.07 |
| 2.5 2 3 100 136 0.74 1.02 |
| 4.6 4 5 69 105 0.66 0.65 |
| 6.5 6 7 67 119 0.56 0.25 |
| 8.5 8 9 75 139 0.54 0.16 |
| 10.5 10 11 60 128 0.47 -0.13 |
| 12.5 12 13 57 118 0.48 -0.07 |
| 15.1 14 16 96 197 0.49 -0.05 |
| 17.0 17 17 33 79 0.42 -0.33 |
| 18.5 18 19 49 147 0.33 -0.69 |
| 20.5 20 21 40 121 0.33 -0.71 |
| 22.5 22 23 24 93 0.26 -1.06 |
+----------------------------------------------------+
可以看出,当残疾分数从 0 增加到 10 左右时,恢复速度会急剧下降,当残疾分数从 10 增加到 15 左右时,恢复速度又会趋于平稳,当残疾分数超过 15 时,恢复速度会继续急剧下降。上述关系可能表明二者间存在非线性关系。进一步,我们通过将残疾状况的二次项、三次项引入到逻辑回归模型中分析,回归结果也证实了上述猜想。
. logistic better score score_2 score_3
Logistic regression Number of obs = 1,552
LR chi2(3) = 207.17
Prob > chi2 = 0.0000
Log likelihood = -969.56991 Pseudo R2 = 0.0965
------------------------------------------------------------------------------
better | Odds ratio Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
score | 0.643 0.050 -5.71 0.000 0.553 0.748
score_2 | 1.032 0.008 4.05 0.000 1.016 1.048
score_3 | 0.999 0.000 -3.63 0.000 0.999 1.000
_cons | 7.937 1.713 9.60 0.000 5.200 12.116
------------------------------------------------------------------------------
4. 参考文献
Garrett, J. M. (2017). LINTREND: Stata module to graph observed proportions or means for a continuous or ordinal X variable. -Link- Garrett, J. M. 1996. sg50: Graphical assessment of linear trend. Stata Technical Bulletin 30: 9–15. In Stata Technical Bulletin Reprints, vol. 5, 152–160. College Station, TX: Stata Press. -PDF- Ronan M. Conroy, 2002. "Choosing an appropriate real-life measure of effect size:the case of a continuous predictor and a binary outcome," Stata Journal, StataCorp LP, vol. 2(3), pages 290-295, August. -PDF-
5. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh 绘图, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:Stata教程 普林斯顿Stata教程(二) - Stata绘图 专题:Stata绘图 Stata 绘图:用 Stata 绘制一打精美图片-schemes 常用科研统计绘图工具介绍 Stata绘图极简新模板:plotplain和plottig-T251 给你的图形化个妆:Stata绘图常用选项汇总-上篇 给你的图形化个妆:Stata绘图常用选项汇总-下篇 Stata绘图:柱状图专题-T212 Stata绘图:回归系数可视化-论文更出彩 Stata绘图:重新定义坐标轴刻度标签 Stata绘图:用-bytwoway-实现快速分组绘图 Stata绘图:一个干净整洁的-Stata-图形模板qlean Stata绘图:在图片中添加虚线网格线 Stata绘图:怎么在Stata图形中附加水平线或竖直线? Stata绘图:bgshade命令-在图形中加入经济周期阴影 Stata绘图:让图片透明——你不要掩盖我的光芒 Stata:图形美颜-自定义绘图模板-grstyle-palettes Stata绘图:多维柱状图绘制 Stata绘图:用暂元统一改变图形中的字号 一文看尽 Stata 绘图
连享会:因果推断专题
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下:连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。